## [1] "Nuestra base de datos tiene  21477 observaciones"
## [1] "Se obtienen 14271 listados y  121  variables después de limpieza, quitar NA's y creación de variables"

Se obtienen datos de 21,477 listados en la CDMX para enero 2020. Siguiendo a (Cai et al., 2019) se filtran los listados con al menos una opinión (comentario) en los últimos 6 meses garantizando que los listados estuvieran “activos” al momento del estudio. Además, se remueven todas las observaciones con valores de NA en alguna variable, resultando en 121 variables y 14,271 observaciones.

Datos

Variable Descripción Fuente / Proceso
Precio Precio por noche (se transforma a log para regresión) Inside Airbnb
Listado entero Variable dicotómica: 1 = toda la casa / apto., 0 = no toda la casa / apto. Inside Airbnb. Creada a partir del tipo de hapitación/casa
Huéspedes permitidos Número máximo de huéspedes permitidos Inside Airbnb
Habitaciones Número de habitaciones Inside Airbnb
Baños Número de baños completos y medios Inside Airbnb
Amenidades Índice aditivo: “Family Friendly” + “Business Ready” + Desayuno + Estacionamiento + Wi-Fi + CableTV + Piscina + Ascensor
+ Gimnasio + Portero + Lavadora + Licuadora + Calefacción + …
Inside Airbnb. Índice creado a partir de extracción de texto en descripción.
Política de reservación Índice aditivo: Flexibilidad de cancelación + Con noches mínimas + Tarifa de limpieza + Requerir que el huesped tenga documento verificado Inside Airbnb. Índice creado a partir de dummies de requerimientos.
Localización Distancia media (fórmula Haversine) al Punto de Interés (PDI) más cercano. Selección de 10 puntos más visitados de CDMX Tripadvisor para elección de PDI y Google Maps para datos geográficos.
Competencia Número de competidores con mismo número de habitaciones en una distancia de 400 m. (fórmula Haversine) Inside Airbnb. Cálculo a partir de ubicación de listado.
Delincuencia Número de Delitos de Bajo Impacto, Robos a casa habitación,
Robo con/sin violencia y Robos a transeúnte con/sin violencia
Portal de datos de la CDMX. Carpetas de investigación FGJ
Acceso transporte Distancia Distancia media (fórmula Haversine)
a estación de transporte colectivo Metrobús o Metro
Portal de datos de la CDMX. Líneas y estaciones de Metrobús. Estaciones de Metro
Anfitrión profesional Anfitrión con más de dos listados registrados Inside Airbnb
Estatus Superhost Dummy de certificado Superhost otorgado por Airbnb Inside Airbnb
Promedio de calificación Clasificación global (promedio sobre 100) Inside Airbnb
Descripción Presentación del anfitrión (medido en caracteres) Inside Airbnb. Creado a partir de extensión de texto de descripción.
Antigüedad Tiempo transcurrido desde que el listado se registró en la plataforma (medido en días) Inside Airbnb. Diferencia entre fecha de registro y fecha de extracción.
Experiencia Tiempo transcurrido desde que el anfitrión se registró en la plataforma (medido en días) Inside Airbnb. Diferencia entre fecha de registro y fecha de extracción.
Número de comentarios Reviews realizadas por huéspedes Inside Airbnb
Sentimiento de comentarios Reviews positivas y negativas (análisis de sentimiento en reviews con diccionario propio. En proceso) Inside Airbnb. Creado a partir de análisis de texto para las Reviews.

Estadística descriptiva

Variable Total / Promedio Profesionales No Profesionales t-test medias
Listados 14,271 5,930 8,341 NA
42% 58%
Listados registrados 5.67 11.82 1.30 p-value
se 0.09 0.18 0.01 0.000
Precio 968.39 1,102.72 872.89 p-value
se 6.60 11.75 7.43 0.000
Precio/ persona 318.84 341.50 302.74 p-value
se 1.78 2.86 2.25 0.000
Listado (hab/casa) entero 0.59 0.58 0.59 p-value
se 0.00 0.01 0.01 0.233
Huéspedes permitidos 1.79 1.90 1.71 p-value
se 0.01 0.02 0.01 0.000
Habitaciones 1.45 1.47 1.43 p-value
se 0.01 0.02 0.01 0.029
Baños 1.40 1.46 1.36 p-value
se 0.01 0.02 0.01 0.000
Amenidades del listado 24.64 25.65 23.92 p-value
se 0.08 0.13 0.10 0.000
Flexible (1=flexible,0=estricto) 0.87 0.90 0.86 p-value
se 0.00 0.00 0.00 0.000
Distancia de PDI (metros) p-value
se
Competencia p-value
se
Delincuencia p-value
se
Acceso transporte p-value
se
Superhost 0.46 0.53 0.42 p-value
se 0.00 0.01 0.01 0.000
Calificación (max 100) 95.62 94.91 96.13 p-value
se 0.05 0.07 0.06 0.000
Descripción anfitrión (caracteres) 190.46 240.63 154.79 p-value
se 2.75 5.01 3.02
Antigüedad listado (días) 615.31 611.63 617.92 p-value
se 4.11 6.63 5.22 0.451
Antigüedad anfitrión (días) 1,320.02 1,395.91 1,266.07 p-value
se 6.05 9.64 7.69 0.000
Reviews totales 31.92 34.79 29.87 p-value
se 0.32 0.54 0.39 0.000
Reviews último mes (Dic 2019) 16.03 17.78 14.79 p-value
se 0.15 0.26 0.19 0.000
Reviews positivas p-value
se
Reviews negativas p-value
se

Mapa Interactivo general

Mapa Interactivo por tipo de anfitrión

Se identifica a un anfitrión profesional como aquel con más de dos \(>2\) listados registrados activos (Cai et al., 2019). En algunos otros artículos como (Lladós-Masllorens et al., 2020) se considera profesional a cualquier anfitrión con más de un listado registrado \(>1\). No hay un consenso al respecto. Nos quedamos con el criterio más estricto de \(>2\) listados.

La hipótesis es que un anfitrión con más listados no es una persona que busque sólo un ingreso adicional rentando su propiedad, sino un agente profesional que considera su actividad en Airbnb como un negocio administrando múltiples propiedades y por tanto su fijación de precios está más informada.

El mapa a continuación muestra los listados profesionales y listados no profesionales.

Podemos acercarnos con el zoom a cada zona.

Gráfica por alcaldía

Gráfica por tipo propiedad

Análisis de reseñas Enero 2020 (Wordcloud)

Estático

.

## png 
##   2

Interactivo

.

Evolución de demanda (reviews como proxy)

Demanda (reseñas desde inicio de Airbnb en México)

Demanda 2019 - 2020 Impacto Covid-19 y recuperación

Estacionalidad de demanda y precios

Estacionalidad de demanda 2017, 2018, 2019 (reviews)

Estacionalidad de precios en todo el periodo

Estacionalidad de precios en semana

Gráficas descriptivas por tipo de anfitrión

## [1] "Listo"
## 2.5 GB